vlm

自动驾驶中常提的VLM是个啥?与VLA有什么区别?

自动驾驶车辆要在复杂多变的道路环境中安全行驶,不仅需要“看见”前方的车辆、行人和路面标志,还需要“读懂”交通标识上的文字提示、施工告示牌和乘客的语言指令。之前和大家讨论过VLA(相关阅读:自动驾驶中常提的VLA是个啥?),了解到视觉-语言-动作模型,但在很多场

模态 transformer vla 自然语言 vlm 2025-09-24 04:46  4

全新小鹏P7的“Ultra”革命

三颗自研图灵AI芯片、800V高压平台、5C超充能力,以及全系双腔空气悬架,这些曾出现在百万级豪车上的配置,如今全部标配在一款21.98万元起售的国产电动轿跑上。

ultra 革命 vla 何小鹏 vlm 2025-08-29 11:26  6

小模型逆袭屠榜!30倍数据效率+13倍模型压缩效果暴增近10%!

亮点直击新发现:旨在解决由编辑指令与原始-编辑图像对之间错位引起的噪声监督问题,这是先前工作忽视的根本性问题,如下图2所示。修正监督:利用扩散生成先验指导视觉语言模型,为原始-编辑图像对生成更匹配的编辑指令。强化监督:引入基于三元组损失的对比监督,使编辑模型能

模型 图像编辑 文生 先验 vlm 2025-05-17 01:03  11